sid-balachandran-_9a-3NO5KJE-unsplash.jpg

Quando comecei a ver as primeiras coisas sobre análise de dados me deparei com a seguinte pergunta: “Quais as vantagens em se utilizar o Pandas no Python ao em vez do Microsoft Excel para análise de dados?”

Não penso que seja uma questão de escolha entre “Python & Pandas” ou “Excel”. Com o tempo passei a enxergá-los como duas ferramentas que se complementam. Eu não usaria o Pandas para procurar dados, mas você poderia. Tampouco usaria o Excel para limpar dados ou automatizar tarefas, mas você poderia. Acima de tudo, a pergunta é: “Quando usar um ou outro?”

O excel pode não ser o ideal se você realmente quer ser um cientista de dados, mesmo que você disponha de tempo para tratar os dados, possua uma base com poucos dados e personalizar visualmente suas planilhas.

will.gif

O Pandas

O Pandas é uma biblioteca do Python que possui muitas características interessantes e de alto nível. Por exemplo: Com ele você consegue basicamente limpar e tratar os dados de uma forma muito rápida e extremamente amigável para ser usado em Excel posteriormente. Ou seja, você consegue eliminar dados faltantes ou substituí-los em lote, e ainda trabalhar de forma combinada com outras bibliotecas extremamente diversificadas do Python, pode fazer uma análise exploratória de seus dados sem ter que se quer visualizá-los, o que faz muito sentido quando falamos de uma base repleta de dados.

A biblioteca Pandas é indispensável para qualquer cientista de dados.

giphy.gif

No geral, assim como a linguagem R o Pandas do Python é considerado uma linguagem de programação, enquanto o Excel trabalha como planilha.

As linguagens de programação acabam sim, sendo mais poderosas, lhe proporcionando mais autonomia e liberdade à quem analisa os dados, porém custa mais tempo de aprendizado. O Python por si só, é uma linguagem simples de se assimilar, e que como tudo na vida só demanda um pouco de prática.

Caso você deseje se aprofundar no assunto, tenha certeza que seu esforço será recompensado.